智能论文笔记

Deciphering antibody affinity maturation with language models and weakly supervised learning

Jeffrey A. Ruffolo , Jeffrey J. Gray , Jeremias Sulam

分类：机器学习

2021-12-14

响应于病原体，自适应免疫系统产生结合和中和外部抗原的特异性抗体。了解个体的免疫力曲目的组成可以为该过程提供见解，并揭示潜在的治疗抗体。在这项工作中，我们探讨了抗体特定语言模型的应用，以帮助了解免疫曲目。我们介绍抗体，一种在558米天然抗体序列上培训的语言模型。我们发现在reptoIres中，我们的模型群抗体进入了类似亲和力成熟的轨迹。重要的是，我们表明培训的模型在多实例学习框架下预测高度冗余序列，识别过程中的密钥绑定残留物。通过进一步发展，这里呈现的方法将为单独的ReptoIre序列的抗原结合提供新的见解。

translated by 谷歌翻译

Mapping Husserlian phenomenology onto active inference

Mahault Albarracin , Riddhi J. Pitliya , Maxwell J. D. Ramstead , Jeffrey Yoshimi

分类：人工智能

2022-08-18

现象学是对有意识经验的严格描述性研究。最近对侯赛利亚现象学形式化的尝试为我们提供了一种数学模型，这是先验知识和期望的函数。在本文中，我们通过主动推理的镜头重新检查了侯赛利亚现象学的元素。在这样做的过程中，我们旨在推进计算现象学的项目，正如主动推理的支持者最近概述的那样。我们建议，可以将胡塞尔对意识描述的关键方面映射到与主动推理方法相关的生成模型的各个方面。我们首先简要审查主动推论。然后，我们讨论了胡塞尔的现象学，重点是时间意识。最后，我们介绍了从侯赛利亚现象学到主动推断的映射。

translated by 谷歌翻译

Firenze: Model Evaluation Using Weak Signals

Bhavna Soman , Ali Torkamani , Michael J. Morais , Jeffrey Bickford , Baris Coskun

分类：人工智能 | 机器学习

2022-07-02

安全字段中的数据标签通常是嘈杂，有限或偏向于人口子集的。结果，诸如准确性，精度和召回指标之类的普遍评估方法，或从标记数据集中计算的性能曲线的分析对机器学习（ML）模型的现实性能没有足够的信心。这减慢了该领域的机器学习的采用。在当今的行业中，我们依靠域专业知识和冗长的手动评估来建立此信心，然后再运送新的安全应用程序模型。在本文中，我们介绍了Firenze，这是一种使用域专业知识对ML模型的性能进行比较评估的新型框架，并编码为称为标记的可扩展功能。我们表明，在称为感兴趣的区域的样本中计算和组合的标记可以提供对其现实世界表演的强大估计。至关重要的是，我们使用统计假设检验来确保观察到的差异，因此从我们的框架中得出的结论 - 比仅噪声可观察到的更为突出。使用模拟和两个现实世界数据集用于恶意软件和域名声誉检测，我们说明了方法的有效性，局限性和见解。综上所述，我们建议Firenze作为研究人员，领域专家和企业主混合团队的快速，可解释和协作模型开发和评估的资源。

translated by 谷歌翻译

Do As I Can, Not As I Say: Grounding Language in Robotic Affordances

Michael Ahn , Anthony Brohan , Noah Brown , Yevgen Chebotar , Omar Cortes , Byron David , Chelsea Finn , Chuyuan Fu , Keerthana Gopalakrishnan , Karol Hausman

分类：机器人 | 自然语言处理 | 机器学习

2022-04-04

大型语言模型可以编码有关世界的大量语义知识。这种知识对于旨在采取自然语言表达的高级，时间扩展的指示的机器人可能非常有用。但是，语言模型的一个重大弱点是，它们缺乏现实世界的经验，这使得很难利用它们在给定的体现中进行决策。例如，要求语言模型描述如何清洁溢出物可能会导致合理的叙述，但是它可能不适用于需要在特定环境中执行此任务的特定代理商（例如机器人）。我们建议通过预处理的技能来提供现实世界的基础，这些技能用于限制模型以提出可行且在上下文上适当的自然语言动作。机器人可以充当语言模型的“手和眼睛”，而语言模型可以提供有关任务的高级语义知识。我们展示了如何将低级技能与大语言模型结合在一起，以便语言模型提供有关执行复杂和时间扩展说明的过程的高级知识，而与这些技能相关的价值功能则提供了连接必要的基础了解特定的物理环境。我们在许多现实世界的机器人任务上评估了我们的方法，我们表明了对现实世界接地的需求，并且这种方法能够在移动操纵器上完成长远，抽象的自然语言指令。该项目的网站和视频可以在https://say-can.github.io/上找到。

translated by 谷歌翻译

A workflow for segmenting soil and plant X-ray CT images with deep learning in Googles Colaboratory

Devin A. Rippner , Pranav Raja , J. Mason Earles , Alexander Buchko , Mina Momayyezi , Fiona Duong , Dilworth Parkinson , Elizabeth Forrestel , Ken Shackel , Jeffrey Neyhart

分类：计算机视觉

2022-03-18

X射线微型计算机断层扫描（X射线Microct）已使以微米尺度上的植物和土壤中发生的特性和过程表征。尽管这种高级技术广泛使用，但硬件和软件的主要限制都限制了图像处理和数据分析的速度和准确性。机器学习的最新进展，特别是将卷积神经网络应用于图像分析的应用，已实现了图像数据的快速而准确的分割。然而，在将卷积神经网络应用于环境和农业相关图像的分析中仍然存在挑战。具体而言，计算机科学家和工程师，构建这些AI/ML工具的工程师与农业研究中潜在的最终用户之间存在脱节，他们可能不确定如何在其工作中应用这些工具。此外，与传统的计算系统相比，培训和应用深度学习模型所需的计算资源是独特的，对计算机游戏系统或图形设计工作更为常见。为了应对这些挑战，我们开发了一个模块化工作流程，用于使用Googles Colaboragoration Web应用程序中的低成本资源，将卷积神经网络应用于X射线Microct图像。在这里，我们介绍了工作流的结果，说明了如何使用核桃叶，杏仁花芽和土壤骨料的示例扫描来优化参数以获得最佳结果。我们预计该框架将加速植物和土壤科学中新兴的深度学习技术的采用和使用。

translated by 谷歌翻译

Real Robot Challenge: A Robotics Competition in the Cloud

Stefan Bauer , Felix Widmaier , Manuel Wüthrich , Annika Buchholz , Sebastian Stark , Anirudh Goyal , Thomas Steinbrenner , Joel Akpo , Shruti Joshi , Vincent Berenz

分类：机器人

2021-09-22

灵巧的操纵仍然是机器人技术中的一个空缺问题。为了协调研究界为解决这个问题的努力，我们提出了共同的基准。我们设计和构建了机器人平台，该平台托管在MPI上供智能系统托管，可以远程访问。每个平台由三个能够敏捷物体操纵的机器人手指组成。用户能够通过提交自动执行的代码（类似于计算群集）来远程控制平台。使用此设置，i）我们举办机器人竞赛，来自世界任何地方的团队访问我们的平台以应对具有挑战性的任务ii）我们发布了在这些比赛中收集的数据集（包括数百个机器人小时），而我们为研究人员提供了访问自己项目的这些平台。

translated by 谷歌翻译

MurTree: Optimal Classification Trees via Dynamic Programming and Search

Emir Demirović , Anna Lukina , Emmanuel Hebrard , Jeffrey Chan , James Bailey , Christopher Leckie , Kotagiri Ramamohanarao , Peter J. Stuckey

分类：机器学习 | 人工智能 | (统计)机器学习

2020-07-24

决策树学习是机器学习中广泛使用的方法，在需要简洁明了的模型的应用中受到青睐。传统上，启发式方法用于快速生产具有相当高准确性的模型。然而，一个普遍的批评是，从精度和大小方面，所产生的树可能不一定是数据的最佳表示。近年来，这激发了最佳分类树算法的发展，这些算法与执行一系列本地最佳决策的启发式方法相比，在全球范围内优化决策树。我们遵循这一工作线，并提供了一种基于动态编程和搜索的最佳分类树的新颖算法。我们的算法支持对树的深度和节点数量的约束。我们方法的成功归因于一系列专门技术，这些技术利用了分类树独有的属性。传统上，最佳分类树的算法受到了高运行时的困扰和有限的可伸缩性，但我们在一项详细的实验研究中表明，我们的方法仅使用最先进的时间所需的时间，并且可以处理数十个数据集的数据集在数千个实例中，提供了几个数量级的改进，并特别有助于实现最佳决策树的实现。

translated by 谷歌翻译

Data-Efficient Image Recognition with Contrastive Predictive Coding

Olivier J. Hénaff , Aravind Srinivas , Jeffrey De Fauw , Ali Razavi , Carl Doersch , S. M. Ali Eslami , Aaron van den Oord

分类：

2019-05-22

Human observers can learn to recognize new categories of images from a handful of examples, yet doing so with artificial ones remains an open challenge. We hypothesize that data-efficient recognition is enabled by representations which make the variability in natural signals more predictable. We therefore revisit and improve Contrastive Predictive Coding, an unsupervised objective for learning such representations. This new implementation produces features which support state-of-theart linear classification accuracy on the ImageNet dataset. When used as input for non-linear classification with deep neural networks, this representation allows us to use 2-5× less labels than classifiers trained directly on image pixels. Finally, this unsupervised representation substantially improves transfer learning to object detection on the PASCAL VOC dataset, surpassing fully supervised pre-trained ImageNet classifiers.

translated by 谷歌翻译

Human-centered XAI for Burn Depth Characterization

Maxwell J. Jacobson , Daniela Chanci Arrubla , Maria Romeo Tricas , Gayle Gordillo , Yexiang Xue , Chandan Sen , Juan Wachs

分类：计算机视觉 | 人工智能

2022-10-24

Approximately 1.25 million people in the United States are treated each year for burn injuries. Precise burn injury classification is an important aspect of the medical AI field. In this work, we propose an explainable human-in-the-loop framework for improving burn ultrasound classification models. Our framework leverages an explanation system based on the LIME classification explainer to corroborate and integrate a burn expert's knowledge -- suggesting new features and ensuring the validity of the model. Using this framework, we discover that B-mode ultrasound classifiers can be enhanced by supplying textural features. More specifically, we confirm that texture features based on the Gray Level Co-occurance Matrix (GLCM) of ultrasound frames can increase the accuracy of transfer learned burn depth classifiers. We test our hypothesis on real data from porcine subjects. We show improvements in the accuracy of burn depth classification -- from ~88% to ~94% -- once modified according to our framework.

translated by 谷歌翻译

Graph Neural Networks for Low-Energy Event Classification & Reconstruction in IceCube

R. Abbasi , M. Ackermann , J. Adams , N. Aggarwal , J. A. Aguilar , M. Ahlers , M. Ahrens , J. M. Alameddine , A. A. Alves Jr. , N. M. Amin

分类：机器学习

2022-09-07

ICECUBE是一种用于检测1 GEV和1 PEV之间大气和天体中微子的光学传感器的立方公斤阵列，该阵列已部署1.45 km至2.45 km的南极的冰盖表面以下1.45 km至2.45 km。来自ICE探测器的事件的分类和重建在ICeCube数据分析中起着核心作用。重建和分类事件是一个挑战，这是由于探测器的几何形状，不均匀的散射和冰中光的吸收，并且低于100 GEV的光，每个事件产生的信号光子数量相对较少。为了应对这一挑战，可以将ICECUBE事件表示为点云图形，并将图形神经网络（GNN）作为分类和重建方法。 GNN能够将中微子事件与宇宙射线背景区分开，对不同的中微子事件类型进行分类，并重建沉积的能量，方向和相互作用顶点。基于仿真，我们提供了1-100 GEV能量范围的比较与当前ICECUBE分析中使用的当前最新最大似然技术，包括已知系统不确定性的影响。对于中微子事件分类，与当前的IceCube方法相比，GNN以固定的假阳性速率（FPR）提高了信号效率的18％。另外，GNN在固定信号效率下将FPR的降低超过8（低于半百分比）。对于能源，方向和相互作用顶点的重建，与当前最大似然技术相比，分辨率平均提高了13％-20％。当在GPU上运行时，GNN能够以几乎是2.7 kHz的中位数ICECUBE触发速率的速率处理ICECUBE事件，这打开了在在线搜索瞬态事件中使用低能量中微子的可能性。

translated by 谷歌翻译